Convolutional Neural Networks (CNN)

Machine Learning - কেরাস ডিপ লার্নিং (Deep Learning with Keras)

216

Convolutional Neural Networks (CNNs) একটি বিশেষ ধরনের নিউরাল নেটওয়ার্ক যা প্রধানত চিত্র এবং ভিডিও বিশ্লেষণের জন্য ব্যবহৃত হয়। CNNs হল ডীপ লার্নিং এর একটি শক্তিশালী উপশাখা এবং এটি বিশেষভাবে চিত্র প্রক্রিয়াকরণ এবং স্বয়ংক্রিয়ভাবে বৈশিষ্ট্য চিহ্নিত করার জন্য ডিজাইন করা হয়েছে। CNNs ফিচার এক্সট্রাকশন এবং প্যাটার্ন রেকগনিশন টাস্কগুলিতে চমৎকার পারফর্মেন্স প্রদান করে।

CNN এর কাঠামো

CNN গুলোর মূল কাঠামো তিনটি প্রধান অংশের সমন্বয়ে গঠিত:

Convolutional Layer (কনভোলিউশনাল লেয়ার):
- এটি CNN এর প্রথম স্তর, যেখানে ইনপুট ডেটার ওপর কনভোলিউশন অপারেশন সম্পাদিত হয়। এই স্তরে কনভোলিউশন ফিল্টার বা কনভোলিউশন কেরনেল ব্যবহার করে ইমেজের বৈশিষ্ট্যগুলো বের করা হয়।
- কনভোলিউশনাল লেয়ারের কাজ হল ইনপুট চিত্রের প্যাটার্ন বা বৈশিষ্ট্য বের করা যেমন এজ, টেক্সচার ইত্যাদি।
Activation Layer (অ্যাক্টিভেশন লেয়ার):
- কনভোলিউশনাল লেয়ার থেকে আউটপুট পেতে অ্যাক্টিভেশন ফাংশন (সাধারণত ReLU) ব্যবহার করা হয়, যা প্যাসিভ তথ্যকে প্রক্রিয়া করার জন্য সক্রিয় করে।
Pooling Layer (পুলিং লেয়ার):
- পুলিং স্তর ইনপুট চিত্রের আকার কমানোর জন্য ব্যবহৃত হয়, যাতে মডেলটি কম্পিউটেশনালি আরও কার্যকর হয় এবং বিভিন্ন বৈশিষ্ট্য অক্ষুণ্ণ থাকে। সবচেয়ে সাধারণ পুলিং অপারেশন হল Max Pooling, যেখানে সবচেয়ে বড় মানটি নির্বাচিত হয়।
Fully Connected Layer (ফুলি কানেক্টেড লেয়ার):
- এটি সাধারণ নিউরাল নেটওয়ার্কের মতো কাজ করে, যেখানে চিত্রের একাধিক বৈশিষ্ট্যকে একত্রিত করে শ্রেণীভুক্ত করা হয়। এখান থেকে মডেলটি চিত্রের ভিত্তিতে সিদ্ধান্ত নেয়।
Output Layer (আউটপুট লেয়ার):
- আউটপুট স্তরে মডেলটি চিত্রটির শ্রেণী (যেমন, কুকুর, বিড়াল, বা অন্য কোন অবজেক্ট) চিহ্নিত করে।

CNN এর সুবিধা

স্বয়ংক্রিয় ফিচার এক্সট্রাকশন:
- CNNs ইনপুট চিত্রের থেকে স্বয়ংক্রিয়ভাবে বৈশিষ্ট্য বা প্যাটার্ন শিখে, যা ফিচার এক্সট্রাকশন প্রক্রিয়া সহজ করে তোলে।
পারামিটার শেয়ারিং:
- CNN তে একই কনভোলিউশন ফিল্টার ইনপুট ইমেজের বিভিন্ন অংশে ব্যবহার করা হয়, ফলে কম্পিউটেশনাল খরচ কমে যায় এবং মডেলটি আরও দক্ষ হয়।
স্থানীয় সংযোগ:
- CNN শুধুমাত্র স্থানীয়ভাবে সংযুক্ত লেয়ারগুলোকে একত্রিত করে, অর্থাৎ একটি পিক্সেলের সাথে তার প্রতিবেশী পিক্সেলের সম্পর্ক শিখে, যা স্থানীয় প্যাটার্ন চিহ্নিত করতে সহায়ক।
ডিপ লার্নিংয়ে উন্নত পারফরম্যান্স:
- CNN চিত্র শ্রেণীবদ্ধকরণ, অবজেক্ট ডিটেকশন, সেগমেন্টেশন, এবং আরও অনেক কাজে অত্যন্ত কার্যকরী এবং উন্নত পারফরম্যান্স প্রদান করে।

CNN ব্যবহার ক্ষেত্র

চিত্র শ্রেণীবদ্ধকরণ (Image Classification):
- CNN এর সবচেয়ে সাধারণ ব্যবহার হল চিত্র শ্রেণীবদ্ধকরণ, যেখানে একটি চিত্রের মধ্যে অবজেক্ট শনাক্ত করা হয়, যেমন এক্স-রে ইমেজ বিশ্লেষণ, পশু চিহ্নিতকরণ ইত্যাদি।
অবজেক্ট ডিটেকশন (Object Detection):
- CNN অবজেক্ট ডিটেকশন সিস্টেমে ব্যবহৃত হয়, যেখানে শুধুমাত্র অবজেক্ট শনাক্ত করা হয় না, বরং সেই অবজেক্টের অবস্থানও চিহ্নিত করা হয় (যেমন একটি গাড়ি, মানুষ ইত্যাদি)। উদাহরণস্বরূপ, YOLO (You Only Look Once) এবং R-CNN।
চিত্র সেগমেন্টেশন (Image Segmentation):
- চিত্র সেগমেন্টেশন টাস্কে CNN গুলি প্রতিটি পিক্সেলকে শ্রেণীভুক্ত করে এবং চিত্রের অংশগুলিকে আলাদা আলাদা বিভাগে ভাগ করে, যা চিকিৎসা চিত্র বিশ্লেষণ বা সেল সেগমেন্টেশন করতে ব্যবহৃত হয়।
ভিডিও বিশ্লেষণ (Video Analysis):
- CNNs ভিডিওর ফ্রেম বিশ্লেষণ করতে ব্যবহার করা হয়, যেমন অবজেক্ট ট্র্যাকিং, অ্যাকশন রেকগনিশন ইত্যাদি।
স্বয়ংক্রিয় ড্রাইভিং (Autonomous Driving):
- CNN গুলি স্বয়ংক্রিয় ড্রাইভিং সিস্টেমে সড়ক চিত্র বিশ্লেষণ করতে ব্যবহৃত হয়, যেখানে গাড়ির চলার পথে বিভিন্ন অবজেক্ট এবং রাস্তা চিহ্নিত করতে CNN এর সাহায্যে একটি সঠিক সিদ্ধান্ত নেয়া হয়।

Keras এ CNN মডেল তৈরি করা

Keras এ একটি সাধারণ CNN মডেল তৈরি করা:

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# CNN মডেল তৈরি
model = Sequential()

# প্রথম কনভোলিউশনাল লেয়ার
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))

# প্রথম পুলিং লেয়ার
model.add(MaxPooling2D(pool_size=(2, 2)))

# দ্বিতীয় কনভোলিউশনাল লেয়ার
model.add(Conv2D(64, (3, 3), activation='relu'))

# দ্বিতীয় পুলিং লেয়ার
model.add(MaxPooling2D(pool_size=(2, 2)))

# তৃতীয় কনভোলিউশনাল লেয়ার
model.add(Conv2D(64, (3, 3), activation='relu'))

# ফ্ল্যাট লেয়ার
model.add(Flatten())

# পূর্ণ কানেক্টেড লেয়ার
model.add(Dense(64, activation='relu'))

# আউটপুট লেয়ার
model.add(Dense(10, activation='softmax'))

# মডেল কম্পাইল করা
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# মডেল সারাংশ
model.summary()

মডেল প্রশিক্ষণ:

# MNIST ডেটাসেট লোড করা
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# ডেটাসেট লোড করা এবং প্রিপ্রসেসিং করা
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape((x_train.shape[0], 28, 28, 1)).astype('float32') / 255
x_test = x_test.reshape((x_test.shape[0], 28, 28, 1)).astype('float32') / 255

# আউটপুট লেবেল ক্যাটাগোরিকাল রূপান্তর করা
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# মডেল প্রশিক্ষণ
model.fit(x_train, y_train, epochs=5, batch_size=64, validation_data=(x_test, y_test))

সারাংশ

Convolutional Neural Networks (CNNs) চিত্র এবং ভিডিও বিশ্লেষণের জন্য অত্যন্ত কার্যকরী এবং শক্তিশালী। CNNs বিভিন্ন ধরণের লেয়ার ব্যবহার করে ইনপুট চিত্রের বৈশিষ্ট্য শিখে এবং চিত্র শ্রেণীবদ্ধকরণ, অবজেক্ট ডিটেকশন, এবং সেগমেন্টেশন সহ বিভিন্ন অ্যাপ্লিকেশন তৈরি করতে সহায়তা করে। Keras ব্যবহার করে CNN মডেল তৈরি করা সহজ এবং এটি দ্রুত ডিপ লার্নিং মডেল প্রোটোটাইপিং এবং প্রশিক্ষণ করার জন্য আদর্শ।

Content added By

Md Azizur Rahman

CNN কী এবং কিভাবে কাজ করে?

147

CNN (Convolutional Neural Network) হল একটি বিশেষ ধরনের নিউরাল নেটওয়ার্ক যা প্রধানত চিত্র বিশ্লেষণ এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) এর জন্য ব্যবহৃত হয়। এটি ডীপ লার্নিং এর একটি শক্তিশালী অংশ যা কনভোলিউশনাল লেয়ার ব্যবহার করে ছবি বা অন্যান্য স্পেসিয়াল ডেটা থেকে বৈশিষ্ট্য বের করার কাজ করে। CNN এর শক্তি তার ক্ষমতায় চিত্রের মধ্যে বিভিন্ন স্তরের বৈশিষ্ট্য শিখে এবং কম্পিউটেশনাল দক্ষতার সাথে তা প্রক্রিয়া করে।

CNN এর প্রধান অংশ

Convolutional Layer (কনভোলিউশনাল লেয়ার):
- Convolutional Layer হল CNN এর মূল উপাদান যা ইনপুট ডেটা থেকে বৈশিষ্ট্য (features) শিখে। এটি একটি ফিল্টার (kernel) ব্যবহার করে ইনপুট ইমেজের সাথে কনভোলিউশন অপারেশন করে।
- প্রতিটি ফিল্টার একটি ছোট অংশের তথ্য শিখে (যেমন একটি ছোট ছবি অংশের প্যাটার্ন)। এই ফিল্টারটি পুরো চিত্রের ওপর সরানো হয় এবং প্রতিটি পজিশনে কনভোলিউশন প্রক্রিয়া করা হয়।
- কনভোলিউশনাল লেয়ারে সাধারণত একাধিক ফিল্টার ব্যবহার করা হয় যাতে বিভিন্ন বৈশিষ্ট্য যেমন কোণ, রেখা, টেক্সচার ইত্যাদি শিখা যায়।
Activation Layer (এক্টিভেশন লেয়ার):
- কনভোলিউশনাল লেয়ারের আউটপুট এক্টিভেশন ফাংশনের মাধ্যমে সঞ্চালিত হয়, যেমন ReLU (Rectified Linear Unit)। এই ফাংশনটি নেতিবাচক মানগুলোকে শূন্যে রূপান্তরিত করে এবং ইতিবাচক মানগুলো অপরিবর্তিত রাখে, যা মডেলকে লিনিয়ার নয় এমন বৈশিষ্ট্য শিখতে সহায়ক।
Pooling Layer (পুলিং লেয়ার):
- Pooling হল একটি ডাউনসাম্পলিং পদ্ধতি যা ইমেজের আকার ছোট করে। এটি ফিচারের গুরুত্ব সংরক্ষণ করতে সহায়ক এবং সঞ্চয়যোগ্যতা বাড়ায়।
- সাধারণত Max Pooling ব্যবহার করা হয়, যেখানে একটি পুলিং উইন্ডো ব্যবহার করে, সেই উইন্ডোর মধ্যে সবচেয়ে বড় ভ্যালু নেয়া হয়।
- উদাহরণ: একটি 2x2 ম্যাট্রিক্সে, Max Pooling এর মাধ্যমে সর্বোচ্চ মানটি বেছে নেওয়া হবে।
Fully Connected Layer (FC Layer):
- কনভোলিউশনাল এবং পুলিং লেয়ারের পরে, পুরো ইমেজের বৈশিষ্ট্যগুলি একত্রিত হয়ে একটি ফ্ল্যাট (১-ডি) আউটপুট তৈরি হয় এবং Fully Connected Layers (FC) এর মাধ্যমে শ্রেণীকরণ (classification) বা অন্যান্য সিদ্ধান্ত নেওয়া হয়।
- এই লেয়ারটি সাধারণত শেষ লেয়ারে থাকে এবং Softmax অ্যাক্টিভেশন ফাংশন ব্যবহার করা হয়, যা প্রতিটি ক্লাসের সম্ভাবনা বের করে।
Output Layer (আউটপুট লেয়ার):
- এটি শেষ লেয়ার, যেখানে মডেলটি কনফিডেন্টলি নির্দিষ্ট শ্রেণিতে ডেটা কনভার্ট করতে সক্ষম হয়। ক্লাসিফিকেশন সমস্যা সমাধানে, আউটপুট লেয়ারটি নির্দিষ্ট শ্রেণীর সংখ্যা অনুসারে নোড রাখে।

CNN কিভাবে কাজ করে?

CNN মডেলটি চিত্রের বিভিন্ন স্তরে বৈশিষ্ট্য শিখে এবং তা একত্রিত করে একটি সিদ্ধান্তে পৌঁছায়। এখানে CNN এর কাজের প্রক্রিয়া সোজাসুজি তুলে ধরা হলো:

ইনপুট লেয়ার:
- প্রথমে একটি চিত্র (যেমন 28x28 পিক্সেল ছবি) ইনপুট হিসেবে নেওয়া হয়। এই ছবি RGB (Red, Green, Blue) চ্যানেল সহ হতে পারে, তবে গ্রেস্কেল ইমেজও ব্যবহার করা যেতে পারে।
কনভোলিউশনাল লেয়ার:
- ইমেজের প্রতি অংশের সাথে কনভোলিউশন ফিল্টার প্রয়োগ করা হয়। এটি একটি প্যাটার্ন খোঁজে (যেমন রেখা, কোণ, রং ইত্যাদি) এবং কনভোলিউশন অপারেশন এর মাধ্যমে ঐ প্যাটার্নগুলো চিনে। এই প্রক্রিয়া চিত্রের উচ্চতর বৈশিষ্ট্য চিহ্নিত করতে সহায়ক।
এক্টিভেশন লেয়ার:
- কনভোলিউশনাল লেয়ার থেকে আউটপুট পাওয়ার পর, এক্টিভেশন ফাংশন (যেমন ReLU) প্রয়োগ করা হয়, যা মডেলকে শূন্য এবং নেতিবাচক মানগুলোকে বাদ দিতে সহায়ক। এটি মডেলকে অকার্যকর বৈশিষ্ট্য থেকে মুক্ত রাখে।
পুলিং লেয়ার:
- পুলিং লেয়ার ইমেজের আকার ছোট করে, কিন্তু ফিচারগুলির গুরুত্বপূর্ণ বৈশিষ্ট্য সংরক্ষণ করে। এটি কম্পিউটেশনাল খরচ কমাতে সাহায্য করে এবং মডেলটির কার্যকারিতা বাড়ায়।
ফুলি কানেক্টেড লেয়ার:
- এখানে, মডেলটি একাধিক বৈশিষ্ট্য একত্রিত করে এবং ফলস্বরূপ একটি ভেক্টর আকারে আউটপুট তৈরি করে। এই আউটপুট ক্লাসিফিকেশন বা রিগ্রেশন সমস্যার জন্য ব্যবহৃত হয়।
আউটপুট লেয়ার:
- এটি মডেলের চূড়ান্ত সিদ্ধান্ত, যেখানে Softmax ফাংশন বা অন্যান্য ক্লাসিফিকেশন প্রযুক্তি ব্যবহার করে শ্রেণী নির্ধারণ করা হয়।

CNN এর ব্যবহার

চিত্র শ্রেণীকরণ (Image Classification):
- CNN চিত্রের মধ্যে বৈশিষ্ট্য শিখে এবং সেগুলির ভিত্তিতে শ্রেণীভুক্ত করে, যেমন ছবি থেকে কুকুর বা বিড়াল শনাক্ত করা।
অবজেক্ট ডিটেকশন (Object Detection):
- এটি চিত্রের মধ্যে নির্দিষ্ট অবজেক্ট চিহ্নিত করার জন্য ব্যবহৃত হয়। উদাহরণস্বরূপ, গাড়ি বা পথচারী চিহ্নিতকরণ।
চিত্র সেগমেন্টেশন (Image Segmentation):
- চিত্রের বিভিন্ন অংশের মধ্যে সেগমেন্টেশন তৈরি করা, যেমন একটি চিত্রের বিভিন্ন অবজেক্টকে আলাদা করা।
ভিডিও বিশ্লেষণ (Video Analysis):
- CNN ভিডিও ফ্রেম থেকে বৈশিষ্ট্য শিখে, দৃশ্যের মধ্যে আন্দোলন, অবজেক্ট ট্র্যাকিং এবং আচরণ বিশ্লেষণ করতে ব্যবহৃত হয়।
স্বাস্থ্যসেবা (Healthcare):
- কনভোলিউশনাল নিউরাল নেটওয়ার্ক মেডিক্যাল চিত্র বিশ্লেষণে ব্যবহৃত হয়, যেমন এক্স-রে বা সিটি স্ক্যান থেকে রোগ শনাক্তকরণ।
চিত্র পুনর্গঠন (Image Reconstruction):
- এটি নিম্নমানের বা ক্ষতিগ্রস্ত চিত্রের পুনঃনির্মাণের জন্য ব্যবহৃত হয়।

সারাংশ

CNN একটি শক্তিশালী নিউরাল নেটওয়ার্ক যা বিশেষভাবে চিত্র বিশ্লেষণ এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণের জন্য ডিজাইন করা হয়েছে। এটি Convolutional Layers, Activation Layers, Pooling Layers, এবং Fully Connected Layers ব্যবহার করে ইনপুট থেকে উচ্চতর বৈশিষ্ট্য শিখে এবং সেই বৈশিষ্ট্যগুলি ভিত্তিতে একটি সিদ্ধান্তে পৌঁছায়। CNN ব্যবহার করে আপনি চিত্র শ্রেণীকরণ, অবজেক্ট ডিটেকশন, ভিডিও বিশ্লেষণ, এবং আরও অনেক কাজ সম্পন্ন করতে পারেন।

Content added By

Md Azizur Rahman

Convolutional Layers এবং Pooling Layers

206

Convolutional Layers এবং Pooling Layers হল Convolutional Neural Networks (CNNs) এর দুটি গুরুত্বপূর্ণ উপাদান, যা বিশেষভাবে চিত্র বা ভিডিও বিশ্লেষণে ব্যবহৃত হয়। এগুলি মডেলকে আরও কার্যকরভাবে বৈশিষ্ট্য শিখতে এবং ডেটা কম্প্রেস করতে সহায়ক।

Convolutional Layers (Conv Layer)

Convolutional Layer হল নিউরাল নেটওয়ার্কের একটি লেয়ার যা ইনপুট ডেটা থেকে বৈশিষ্ট্য শিখতে ব্যবহৃত হয়। এটি ছবির মধ্যে প্যাটার্ন চিহ্নিত করার জন্য বিশেষভাবে ডিজাইন করা হয়েছে। Convolutional লেয়ার একটি কনভলিউশনাল ফিল্টার বা কর্নেল ব্যবহার করে ইনপুট ডেটার সাথে কনভলিউশন অপারেশন করে, যা ছবি বা ইনপুটের নির্দিষ্ট বৈশিষ্ট্যগুলো বের করে আনে।

কিভাবে কাজ করে?

কনভলিউশন অপারেশন: ইনপুট ইমেজের প্রতিটি অংশের সাথে একটি ফিল্টার (kernel) স্লাইড করে, এবং প্রতিটি অংশের মধ্যে গুণফল নিয়ে একটি নতুন মান তৈরি করা হয়। এই নতুন মানগুলি একটি ফিচার ম্যাপ তৈরি করে, যা ছবির বৈশিষ্ট্য সম্পর্কে ধারণা দেয়।
ফিল্টার (Kernel): কনভলিউশনাল লেয়ার একটি ছোট ম্যাট্রিক্স (যেমন 3x3 বা 5x5) ব্যবহার করে যা ইমেজের উপর স্লাইড করে বিভিন্ন বৈশিষ্ট্য যেমন প্রান্ত, কোণ, টেক্সচার ইত্যাদি শনাক্ত করে।
স্ট্রাইড (Stride): এটি হল কনভলিউশনাল ফিল্টারের স্লাইডিং গতির পরিমাপ। সাধারণত, একটি ফিল্টার ইনপুট ইমেজে স্টেপ বাই স্টেপ চলে, এবং স্ট্রাইড ইঙ্গিত দেয় কতটুকু স্লাইড করা হবে।
প্যাডিং (Padding): অনেক সময় ইনপুট ইমেজের সীমানায় ফিল্টার প্রয়োগ করার জন্য কিছু অতিরিক্ত পিক্সেল যোগ করতে হয়, এটি প্যাডিং বলা হয়। সামঞ্জস্যপূর্ণ প্যাডিং (same padding) মানে ইমেজের আউটপুট আকার ইনপুটের সমান হবে।

Convolutional Layer এর উদাহরণ (Keras):

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D

model = Sequential()

# Convolutional Layer
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))

এখানে, Conv2D লেয়ার 32টি ফিল্টার (kernel) ব্যবহার করছে এবং প্রতিটি ফিল্টারের আকার 3x3। 'relu' এক্টিভেশন ফাংশন ব্যবহৃত হচ্ছে এবং ইনপুট ইমেজের আকার (28x28) এবং চ্যানেল সংখ্যা 1 (গ্রে স্কেল ইমেজ)।

Pooling Layers

Pooling Layer মূলত Convolutional Layer দ্বারা শনাক্ত করা বৈশিষ্ট্যগুলিকে কম্প্রেস বা ডাউনস্যাম্পল করতে ব্যবহৃত হয়। এটি ইনপুট ডেটার আকার কমিয়ে এনে মডেলকে আরও কার্যকরী করে তোলে, যাতে কম্পিউটেশনাল ক্ষমতা বাঁচানো যায় এবং ওভারফিটিং রোধ করা যায়।

কিভাবে কাজ করে?

Pooling লেয়ার সাধারণত Max Pooling বা Average Pooling ব্যবহার করে। এটি কনভলিউশনের পর ফিচার ম্যাপের সঠিক বৈশিষ্ট্যগুলি বের করে এবং তার আকার কমিয়ে দেয়।

Max Pooling: এটি কনভলিউশনাল লেয়ারের আউটপুট ম্যাট্রিক্সের প্রতিটি ছোট অংশ থেকে সর্বোচ্চ মান নির্বাচন করে। এটি মডেলকে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি ফোকাস করতে সাহায্য করে এবং আউটপুটের আকার কমায়।
Average Pooling: এটি প্রতিটি ছোট অংশের গড় মান নেয়, যা কিছুটা মৃদু এবং কম্পিউটেশনালভাবে সহজ হয়।
Pool Size: এটি নির্ধারণ করে যে, প্রতি পুলিং অপারেশন কী পরিমাণ পিক্সেল গ্রহণ করবে, যেমন 2x2 বা 3x3। এটি ছোট অংশে ডেটা ফিল্টারিং করে আউটপুট আকারকে ছোট করে।

Pooling Layer এর উদাহরণ (Keras):

from tensorflow.keras.layers import MaxPooling2D

model.add(MaxPooling2D(pool_size=(2, 2)))

এখানে, MaxPooling2D লেয়ার 2x2 পুলিং উইন্ডো ব্যবহার করে প্রতিটি 2x2 ব্লকের সর্বোচ্চ মান গ্রহণ করবে এবং সেগুলিকে একটি ছোট আকারে কম্প্রেস করবে।

Convolutional Layer এবং Pooling Layer এর কাজের সিস্টেম

Convolutional Layers ইনপুট চিত্র থেকে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি শনাক্ত করে।
Pooling Layers সেই বৈশিষ্ট্যগুলোকে কম্প্রেস করে এবং আউটপুটের আকার ছোট করে দেয়।
এই দুটি লেয়ার একসাথে feature extraction প্রক্রিয়া সম্পাদন করে, যেখানে Convolutional লেয়ার বৈশিষ্ট্যগুলো শিখে এবং Pooling লেয়ার সেগুলিকে ছোট করে।

সারাংশ

Convolutional Layers: ইনপুট চিত্র থেকে বৈশিষ্ট্যগুলি শনাক্ত করতে ব্যবহৃত হয় এবং এটি কনভলিউশন অপারেশন ব্যবহার করে ইনপুটের উপর ফিল্টার প্রয়োগ করে।
Pooling Layers: কনভলিউশনাল লেয়ার দ্বারা শিখিত বৈশিষ্ট্যগুলো কম্প্রেস করে এবং আউটপুটের আকার ছোট করে, ফলে কম্পিউটেশনাল গতি বৃদ্ধি পায় এবং মডেল সহজে প্রশিক্ষিত হয়।
Max Pooling এবং Average Pooling হল প্রধান পুলিং অপশন যা ইমেজের বৈশিষ্ট্য সংরক্ষণ করতে সহায়তা করে।

এগুলি মূলত CNNs এর গুরুত্বপূর্ণ উপাদান যা চিত্র বা ভিডিও প্রক্রিয়াকরণের জন্য খুবই কার্যকর।

Content added By

Md Azizur Rahman

Image Classification এর জন্য CNN তৈরি করা

139

Convolutional Neural Network (CNN) একটি বিশেষ ধরনের নিউরাল নেটওয়ার্ক যা ইমেজ ডেটা প্রক্রিয়া করতে অত্যন্ত কার্যকরী। CNN বিভিন্ন ধরনের লেয়ার ব্যবহার করে যেমন convolutional layers, pooling layers, এবং fully connected layers ইমেজের বৈশিষ্ট্য শিখতে এবং শ্রেণীবিভাজন করতে সহায়ক।

এখানে, আমরা একটি সাধারণ CNN মডেল তৈরি করবো যা একটি ইমেজ ক্লাসিফিকেশন টাস্কে ব্যবহৃত হবে।

ধাপ ১: প্রয়োজনীয় লাইব্রেরি ইনস্টল করা

প্রথমে, আপনি যদি এখনও TensorFlow এবং Keras ইনস্টল না করে থাকেন, তাহলে এগুলো ইনস্টল করতে নিচের কমান্ডটি ব্যবহার করুন:

pip install tensorflow

ধাপ ২: CNN মডেল তৈরি করা

এখন আমরা একটি সাধারণ CNN মডেল তৈরি করবো যা ইমেজ ক্লাসিফিকেশন করবে। উদাহরণস্বরূপ, CIFAR-10 ডেটাসেট ব্যবহার করবো, যা ১০টি ভিন্ন শ্রেণীতে ৬০,০০০ ছবি ধারণ করে। আমাদের CNN মডেলটি এই ডেটাসেটের বিভিন্ন শ্রেণী চিহ্নিত করবে।

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.utils import to_categorical

# CIFAR-10 ডেটাসেট লোড করা
(X_train, y_train), (X_test, y_test) = cifar10.load_data()

# ডেটা স্কেলিং (0-255 রেঞ্জ থেকে 0-1 রেঞ্জে পরিণত করা)
X_train, X_test = X_train / 255.0, X_test / 255.0

# আউটপুট লেবেলগুলিকে ক্যাটেগরিকাল আউটপুটে রূপান্তর করা
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# CNN মডেল তৈরি করা
model = models.Sequential()

# Convolutional Layer 1: 32 ফিল্টার, 3x3 কনভোলিউশন কোর, ReLU অ্যাক্টিভেশন
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D((2, 2)))

# Convolutional Layer 2: 64 ফিল্টার, 3x3 কনভোলিউশন কোর, ReLU অ্যাক্টিভেশন
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))

# Convolutional Layer 3: 64 ফিল্টার, 3x3 কনভোলিউশন কোর, ReLU অ্যাক্টিভেশন
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

# Flatten Layer: ডেটাকে একক ভেক্টর আকারে রূপান্তর করা
model.add(layers.Flatten())

# Fully Connected Layer 1: 64 নিউরন, ReLU অ্যাক্টিভেশন
model.add(layers.Dense(64, activation='relu'))

# আউটপুট লেয়ার: 10 ক্লাস, সিগময়েড অ্যাক্টিভেশন
model.add(layers.Dense(10, activation='softmax'))

# মডেল কম্পাইল করা
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# মডেল সারাংশ দেখা
model.summary()

কোড বিশ্লেষণ:

Conv2D Layer:
- প্রথম কনভোলিউশনাল লেয়ারে ৩২টি ৩x৩ ফিল্টার ব্যবহার করা হয়েছে এবং এটি ইনপুট চিত্রের মধ্যে বৈশিষ্ট্য শিখবে।
- দ্বিতীয় এবং তৃতীয় কনভোলিউশনাল লেয়ারে যথাক্রমে ৬৪টি ফিল্টার ব্যবহার করা হয়েছে।
MaxPooling2D:
- MaxPooling হল একটি প্রযুক্তি যা কনভোলিউশনাল লেয়ারের পর ইমেজের সাইজ কমিয়ে দেয়, এটি প্রক্রিয়াকরণের সময় ডেটার মাত্রা কমাতে সাহায্য করে।
Flatten Layer:
- Flatten লেয়ারটি কনভোলিউশনাল লেয়ারের আউটপুটকে একক ভেক্টর আকারে রূপান্তর করে, যাতে এটি fully connected layer (Dense layer) তে পাঠানো যায়।
Dense Layer:
- Fully connected লেয়ারে 64টি নিউরন ব্যবহার করা হয়েছে। এটি শিখে নেওয়া বৈশিষ্ট্যগুলিকে শ্রেণীবদ্ধ করবে।
- আউটপুট লেয়ারে 10টি নিউরন ব্যবহার করা হয়েছে, প্রতিটি নিউরন একটি ক্লাসের প্রতিনিধিত্ব করে, এবং softmax activation ব্যবহৃত হয়েছে, যা প্রতিটি শ্রেণীর জন্য সম্ভাবনা প্রদান করবে।
Model Compilation:
- Adam optimizer ব্যবহার করা হয়েছে, যা অগ্রসর অপটিমাইজেশন প্রক্রিয়া সরবরাহ করে।
- categorical_crossentropy লস ফাংশনটি ব্যবহার করা হয়েছে, যেটি মাল্টি-ক্লাস ক্লাসিফিকেশন সমস্যায় ব্যবহৃত হয়।
- accuracy মেট্রিকটি ব্যবহার করা হয়েছে, যাতে প্রশিক্ষণের সময় মডেলের সঠিকতা জানা যায়।

ধাপ ৩: মডেল প্রশিক্ষণ করা

এখন, আমরা মডেলটি প্রশিক্ষণ দিবো। এখানে আমরা X_train এবং y_train ডেটা ব্যবহার করবো এবং মডেলটি প্রশিক্ষণ করবো।

# মডেল প্রশিক্ষণ করা
history = model.fit(X_train, y_train, epochs=10, batch_size=64, validation_split=0.2)

epochs=10: মডেলটি 10 বার প্রশিক্ষিত হবে।
batch_size=64: প্রতি ব্যাচে 64টি স্যাম্পল নিয়ে প্রশিক্ষণ করা হবে।
validation_split=0.2: ২০% ডেটা যাচাইয়ের জন্য রাখা হবে।

ধাপ ৪: মডেল মূল্যায়ন

প্রশিক্ষণ শেষে, মডেলটি X_test এবং y_test ডেটার উপর পরীক্ষা করা হবে।

# মডেল মূল্যায়ন করা
loss, accuracy = model.evaluate(X_test, y_test)

print(f"Test Loss: {loss}")
print(f"Test Accuracy: {accuracy}")

সারাংশ

CNN ইমেজ ক্লাসিফিকেশন সমস্যার জন্য একটি শক্তিশালী মডেল তৈরি করতে ব্যবহৃত হয়। এটি Convolutional Layers ব্যবহার করে ইমেজের বৈশিষ্ট্য শিখতে পারে এবং Pooling Layers দ্বারা ডেটার মাত্রা কমিয়ে কার্যক্ষমতা বাড়ায়।
এখানে আমরা CIFAR-10 ডেটাসেট ব্যবহার করে একটি বেসিক CNN মডেল তৈরি করেছি যা ১০টি শ্রেণী চিহ্নিত করবে।
এই মডেলটি কনভোলিউশনাল লেয়ার, ম্যাক্স পুলিং, এবং ফুলি কানেকটেড লেয়ার সমন্বিত করে ডিজাইন করা হয়েছে।

এটি একটি সাধারণ CNN মডেলের উদাহরণ, যা ইমেজ ক্লাসিফিকেশন টাস্কে ব্যবহার করা যেতে পারে।

Content added By

Md Azizur Rahman

CNN মডেল Training এবং Performance Evaluation

172

Convolutional Neural Networks (CNNs) হল ডীপ লার্নিং এর একটি শক্তিশালী মডেল যা প্রধানত চিত্র (Image) বিশ্লেষণ, কম্পিউটার ভিশন এবং অডিও সিগন্যাল প্রসেসিং এর জন্য ব্যবহৃত হয়। CNN মডেল ট্রেনিং এবং এর কর্মক্ষমতা মূল্যায়ন করার জন্য কিছু বিশেষ পদক্ষেপ রয়েছে। এখানে CNN মডেল ট্রেনিং এবং পারফরম্যান্স ইভালুয়েশনের পুরো প্রক্রিয়া নিয়ে বিস্তারিত আলোচনা করা হল।

CNN মডেল ট্রেনিং

CNN মডেল ট্রেনিং এর প্রক্রিয়া সাধারণত কয়েকটি স্তরে ভাগ করা যায়:

ডেটা প্রিপ্রসেসিং (Data Preprocessing):
- CNN মডেল ট্রেনিংয়ের প্রথম পদক্ষেপ হল ইনপুট ডেটার প্রিপ্রসেসিং। এটি অন্তর্ভুক্ত করে:
  - ডেটা রিসাইজিং: চিত্রের আকার সমন্বয় করা।
  - স্কেলিং বা নরমালাইজেশন: পিক্সেল মানের স্কেলিং।
  - ডেটা অগমেন্টেশন: চিত্রের ঘুরানো, বড় করা, ক্রপিং ইত্যাদি।
মডেল আর্কিটেকচার ডিজাইন (Model Architecture Design): CNN মডেল সাধারণত ৩টি ধরনের স্তর ব্যবহার করে:
- কনভোলিউশনাল লেয়ার (Convolutional Layer): ইনপুট ইমেজ থেকে ফিচার এক্সট্র্যাকশন করে।
- পুলিং লেয়ার (Pooling Layer): চিত্রের ডাইমেনশন কমিয়ে ফিচার সংক্ষেপণ করে।
- ফুলি কানেক্টেড লেয়ার (Fully Connected Layer): মডেলের সিদ্ধান্ত গ্রহণের জন্য ফিচারগুলিকে একত্রিত করে।
উদাহরণস্বরূপ একটি CNN আর্কিটেকচার:
```
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

model = Sequential()

# কনভোলিউশনাল লেয়ার
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)))

# পুলিং লেয়ার
model.add(MaxPooling2D(pool_size=(2, 2)))

# আরেকটি কনভোলিউশনাল লেয়ার
model.add(Conv2D(64, (3, 3), activation='relu'))

# আরও পুলিং লেয়ার
model.add(MaxPooling2D(pool_size=(2, 2)))

# ফ্ল্যাট লেয়ার
model.add(Flatten())

# ফুলি কানেক্টেড লেয়ার
model.add(Dense(128, activation='relu'))
model.add(Dense(10, activation='softmax'))  # 10টি ক্লাসের জন্য
```
মডেল কম্পাইলিং (Model Compilation): মডেল ট্রেনিংয়ের জন্য অপটিমাইজার, লস ফাংশন, এবং মেট্রিক নির্ধারণ করা হয়। সাধারণত চিত্র শ্রেণীকরণের জন্য categorical_crossentropy এবং অপটিমাইজার হিসেবে Adam ব্যবহার করা হয়।
```
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
```
মডেল ট্রেনিং (Model Training): মডেল ট্রেনিং শুরু করা হয় fit() মেথড ব্যবহার করে। ইনপুট ডেটা (x_train), টার্গেট আউটপুট (y_train), ব্যাচ সাইজ, এবং ইপোকস এর সংখ্যা নির্ধারণ করা হয়।
```
history = model.fit(x_train, y_train, batch_size=32, epochs=10, validation_data=(x_val, y_val))
```

CNN মডেল Performance Evaluation

CNN মডেলের পারফরম্যান্স ইভালুয়েশন বেশ কিছু গুরুত্বপূর্ণ ধাপে বিভক্ত:

ইভালুয়েশন ডেটার উপর মডেল ইভালুয়েশন (Model Evaluation on Test Data): প্রশিক্ষণ শেষ হওয়ার পর, মডেলটি evaluate() মেথড ব্যবহার করে ইভালুয়েশন ডেটাতে পরীক্ষিত হয়। এটি মডেলটির লস এবং নির্ধারিত মেট্রিক্স (যেমন, accuracy) পরিমাপ করে।
```
loss, accuracy = model.evaluate(x_test, y_test)
print(f"Test Loss: {loss}")
print(f"Test Accuracy: {accuracy}")
```
কনফিউশন ম্যাট্রিক্স (Confusion Matrix): কনফিউশন ম্যাট্রিক্স একটি টুল যা মডেলটির ক্লাসিফিকেশন পারফরম্যান্স পরিমাপ করতে ব্যবহৃত হয়। এটি ভুল এবং সঠিক শ্রেণীবিভাজন শনাক্ত করতে সহায়ক।
```
from sklearn.metrics import confusion_matrix
import numpy as np

y_pred = model.predict(x_test)
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.argmax(y_test, axis=1)

cm = confusion_matrix(y_true, y_pred_classes)
print(cm)
```
প্রিসিশন, রিকল, এবং F1 স্কোর (Precision, Recall, and F1-Score): মডেল পারফরম্যান্সের আরও উন্নত বিশ্লেষণ প্রিসিশন, রিকল এবং F1 স্কোর ব্যবহার করে করা যায়। এগুলি বিশেষভাবে গুরুত্বপূর্ণ যখন ক্লাস ইমব্যালেন্স থাকে।
```
from sklearn.metrics import precision_score, recall_score, f1_score

precision = precision_score(y_true, y_pred_classes, average='weighted')
recall = recall_score(y_true, y_pred_classes, average='weighted')
f1 = f1_score(y_true, y_pred_classes, average='weighted')

print(f"Precision: {precision}")
print(f"Recall: {recall}")
print(f"F1 Score: {f1}")
```

ROC কিউরভ এবং AUC (ROC Curve and AUC): Receiver Operating Characteristic (ROC) কিউরভ এবং Area Under the Curve (AUC) হল ক্লাসিফিকেশন মডেলের পারফরম্যান্স পরিমাপের জন্য গুরুত্বপূর্ণ মেট্রিক্স। এটি কনফিউশন ম্যাট্রিক্সের চেয়ে আরও বিস্তৃত মূল্যায়ন প্রদান করে।

from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt

fpr, tpr, thresholds = roc_curve(y_true, y_pred[:,1])
roc_auc = auc(fpr, tpr)

plt.figure()
plt.plot(fpr, tpr, color='darkorange', lw=2, label='ROC curve (area = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic')
plt.legend(loc="lower right")
plt.show()

Loss and Accuracy Visualization: মডেল ট্রেনিংয়ের সময় প্রশিক্ষণ এবং ভ্যালিডেশন লস এবং একুরেসি মেট্রিক্সের গ্রাফ তৈরি করা মডেলের উন্নতি পর্যালোচনায় সহায়ক।

import matplotlib.pyplot as plt

plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('Model Accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend(['Train', 'Val'], loc='upper left')
plt.show()

plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('Model Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend(['Train', 'Val'], loc='upper left')
plt.show()

সারাংশ

CNN মডেল ট্রেনিং এবং পারফরম্যান্স ইভালুয়েশন হল একটি গুরুত্বপূর্ণ প্রক্রিয়া যা মডেলটির কার্যকারিতা পরিমাপ এবং অপটিমাইজেশনে সহায়ক। মডেল ট্রেনিংয়ের জন্য ডেটা প্রিপ্রসেসিং, আর্কিটেকচার ডিজাইন, কম্পাইল এবং ফিট মেথড ব্যবহার করা হয়, এবং পারফরম্যান্স ইভালুয়েশনের জন্য কনফিউশন ম্যাট্রিক্স, প্রিসিশন, রিকল, F1 স্কোর, এবং ROC কিউরভ ব্যবহার করা হয়।

Content added By

Md Azizur Rahman

Deep Learning এবং Keras এর পরিচিতি Keras ইনস্টলেশন এবং সেটআপ Keras এর মৌলিক ধারণা Keras তে বেসিক Neural Network তৈরি Data Preprocessing এবং Augmentation

Convolutional Neural Networks (CNN)

CNN এর কাঠামো

CNN এর সুবিধা

CNN ব্যবহার ক্ষেত্র

Keras এ CNN মডেল তৈরি করা

মডেল প্রশিক্ষণ:

সারাংশ

CNN কী এবং কিভাবে কাজ করে?

CNN এর প্রধান অংশ

CNN কিভাবে কাজ করে?

CNN এর ব্যবহার

সারাংশ

Convolutional Layers এবং Pooling Layers

Convolutional Layers (Conv Layer)

কিভাবে কাজ করে?

Convolutional Layer এর উদাহরণ (Keras):

Pooling Layers

কিভাবে কাজ করে?

Pooling Layer এর উদাহরণ (Keras):

Convolutional Layer এবং Pooling Layer এর কাজের সিস্টেম

সারাংশ

Image Classification এর জন্য CNN তৈরি করা

ধাপ ১: প্রয়োজনীয় লাইব্রেরি ইনস্টল করা

ধাপ ২: CNN মডেল তৈরি করা

কোড বিশ্লেষণ:

ধাপ ৩: মডেল প্রশিক্ষণ করা

ধাপ ৪: মডেল মূল্যায়ন

সারাংশ

CNN মডেল Training এবং Performance Evaluation

CNN মডেল ট্রেনিং

CNN মডেল Performance Evaluation

সারাংশ

All Notifications

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Promotion